113 research outputs found

    Procedimientos de explotación de información para la identificación de datos faltantes, con ruido e inconsistentes

    Get PDF
    La información es uno de los activos más importantes que tienen las empresas y es necesario garantizar la gobernanza de la tecnología de la información, la calidad de las bases de datos es uno de los elementos fundamentales para lograr esa gobernanza. Un auditor de sistemas dará empleo a muchas técnicas, procesos y herramientas para identificar los datos faltantes, con ruido e inconsistentes en una base de datos, la minería de datos es uno de esos medio a través del cual el auditor puede analizar la información. Dada la enorme cantidad de información que contienen los sistemas software es que los auditores deben emplear procedimientos que automaticen la detección de datos anómalos. Varios algoritmos de minería de datos han sido utilizados en la detección de tuplas consideradas anómalas, el problema es que no se encuentran antecedentes de algoritmos o procedimientos que permitan detectar específicamente dentro de una tupla que campo es el que contiene valores anómalos, siendo esta detección de fundamental importancia en las grandes bases de datos ya que si no es necesario hacer esta tarea en forma manual, requiriendo tiempo y una capacitación especifica por parte del auditor. El objetivo de la tesis es establecer una taxonomía relacionada con los métodos, técnicas y algoritmos de detección de valores anómalos en bases de datos. Y diseñar y validar procedimientos de explotación de información que combinados entre sí permitan detectar los campos que tienen valores atípicos en bases de datos, para mejorar la calidad de los datos. Se detectan tres enfoques diferentes relacionados con la Minería de Datos para detectar datos anómalos, el enfoque no supervisado, el enfoque supervisado y el enfoque semi-supervisado. Esta tesis desarrolla cuatro procedimientos de explotación de información para detectar en forma automática que campo específicamente tiene valores que son considerados anómalos utilizando una metodología hibrida que combina algoritmos de distintos enfoques para realizar la tarea, estos cuatro procedimientos se relacionan con bases de datos numéricas con o sin atributos Target, bases de datos alfanuméricas sin atributo target y bases de datos alfanuméricas con atributos target. Se realizaron pruebas experimentales para validar los resultados utilizando bases de datos de laboratorio y bases de datos reales, demostrándose la eficacia de los procedimientos propuestos. La integración de distintos algoritmos no solo permiten detectar los campos considerados faltantes, con ruido e inconsistentes, sino que minimiza los posibles errores que pueda tener un algoritmo ante tan diversos e inciertos escenarios a los que debe enfrentarse la tarea de un auditor

    Análisis y gestión de riesgo en proyectos software : Un nuevo modelo integrando la metodología SEI y Magerit2

    Get PDF
    Hablar de riesgos es hablar de futuro, de probabilidades, de incertidumbre, de avances o retrocesos. Toda actividad implica un riesgo, y aunque algunos ubican la etimología en la palabra en risco, esto no implica de por sí una valoración negativa, todo cambio implica peligros, pero el peor peligro es la inmovilidad. Un Riesgo es la probabilidad que ocurra una perdida. Los riesgos técnicos del software son la medida de la probabilidad y severidad de que se produzcan efectos adversos en el desarrollo, adquisición, mantenimiento etc. de sistema. Todas las áreas en el desarrollo de sistemas son fuentes potenciales de riesgos de software. Debido a la importancia de estos, en los proyectos software, se realizará una investigación de distintas metodologías para detectar, analizar, eliminar o minimizar los posibles riesgos a los cuales se somete un proyecto software de pequeña a mediana envergadura durante su ciclo de vida (Planificación, análisis, desarrollo, implementación y mantenimiento) y los riesgos generales a los que se somete el TI1 de estas organizaciones. Basados en metodologías de análisis y gestión de riesgos estándares de la TI se busca lograr un método ágil, flexible, rápido y sencillo de utilizar por organización que no cuentan con los medios para poder afrontar los altos costos de los estudios de análisis y 1 Tecnología de la informatica gestión de riesgos realizados por consultoras privadas o por soporte informático especializado. Y como resultado de la investigación se generará un software prototipo basado en las mejores técnicas de las metodologías investigadas.Eje: Ingeniería del Software.Red de Universidades con Carreras en Informátic

    Análisis y gestión de riesgo en proyectos software : Un nuevo modelo integrando la metodología SEI y Magerit2

    Get PDF
    Hablar de riesgos es hablar de futuro, de probabilidades, de incertidumbre, de avances o retrocesos. Toda actividad implica un riesgo, y aunque algunos ubican la etimología en la palabra en risco, esto no implica de por sí una valoración negativa, todo cambio implica peligros, pero el peor peligro es la inmovilidad. Un Riesgo es la probabilidad que ocurra una perdida. Los riesgos técnicos del software son la medida de la probabilidad y severidad de que se produzcan efectos adversos en el desarrollo, adquisición, mantenimiento etc. de sistema. Todas las áreas en el desarrollo de sistemas son fuentes potenciales de riesgos de software. Debido a la importancia de estos, en los proyectos software, se realizará una investigación de distintas metodologías para detectar, analizar, eliminar o minimizar los posibles riesgos a los cuales se somete un proyecto software de pequeña a mediana envergadura durante su ciclo de vida (Planificación, análisis, desarrollo, implementación y mantenimiento) y los riesgos generales a los que se somete el TI1 de estas organizaciones. Basados en metodologías de análisis y gestión de riesgos estándares de la TI se busca lograr un método ágil, flexible, rápido y sencillo de utilizar por organización que no cuentan con los medios para poder afrontar los altos costos de los estudios de análisis y 1 Tecnología de la informatica gestión de riesgos realizados por consultoras privadas o por soporte informático especializado. Y como resultado de la investigación se generará un software prototipo basado en las mejores técnicas de las metodologías investigadas.Eje: Ingeniería del Software.Red de Universidades con Carreras en Informátic

    Análisis y gestión de riesgo en proyectos software : Un nuevo modelo integrando la metodología SEI y Magerit2

    Get PDF
    Hablar de riesgos es hablar de futuro, de probabilidades, de incertidumbre, de avances o retrocesos. Toda actividad implica un riesgo, y aunque algunos ubican la etimología en la palabra en risco, esto no implica de por sí una valoración negativa, todo cambio implica peligros, pero el peor peligro es la inmovilidad. Un Riesgo es la probabilidad que ocurra una perdida. Los riesgos técnicos del software son la medida de la probabilidad y severidad de que se produzcan efectos adversos en el desarrollo, adquisición, mantenimiento etc. de sistema. Todas las áreas en el desarrollo de sistemas son fuentes potenciales de riesgos de software. Debido a la importancia de estos, en los proyectos software, se realizará una investigación de distintas metodologías para detectar, analizar, eliminar o minimizar los posibles riesgos a los cuales se somete un proyecto software de pequeña a mediana envergadura durante su ciclo de vida (Planificación, análisis, desarrollo, implementación y mantenimiento) y los riesgos generales a los que se somete el TI1 de estas organizaciones. Basados en metodologías de análisis y gestión de riesgos estándares de la TI se busca lograr un método ágil, flexible, rápido y sencillo de utilizar por organización que no cuentan con los medios para poder afrontar los altos costos de los estudios de análisis y 1 Tecnología de la informatica gestión de riesgos realizados por consultoras privadas o por soporte informático especializado. Y como resultado de la investigación se generará un software prototipo basado en las mejores técnicas de las metodologías investigadas.Eje: Ingeniería del Software.Red de Universidades con Carreras en Informátic

    Predicting dental implant failures by integrating multiple classifiers

    Get PDF
    El campo de la ciencia de datos ha tenido muchos avances respecto a la aplicación y desarrollo de técnicas en el sector de la salud. Estos avances se ven reflejados en la predicción de enfermedades, clasificación de imágenes, identificación y reducción de riesgos, así como muchos otros. Este trabajo tiene por objetivo investigar el beneficio de la utilización de múltiples algoritmos de clasificación, para la predicción de fracasos en implantes dentales de la provincia de Misiones, Argentina y proponer un procedimiento validado por expertos humanos. El modelo abarca la combinación de los clasificadores: Random Forest, C-Support Vector, K-Nearest Neighbors, Multinomial Naive Bayes y Multi-layer Perceptron. La integración de los modelos se realiza con el weighted soft voting method. La experimentación es realizada con cuatro conjuntos de datos, un conjunto de implantes dentales confeccionado para el estudio de caso, un conjunto generado artificialmente y otros dos conjuntos obtenidos de distintos repositorios de datos. Los resultados arrojados del enfoque propuesto sobre el conjunto de datos de implantes dentales, es validado con el desempeño en la clasificación por expertos humanos. Nuestro enfoque logra un porcentaje de acierto del 93% de casos correctamente identificados, mientras que los expertos humanos consiguen un 87% de precisión.The field of data science has made many advances in the application and development of techniques in several aspects of the health sector, such as in disease prediction, image classification, risk identification and risk reduction. Based on this, the objectives of this work were to investigate the benefit of using multiple classification algorithms to predict dental implant failures in patients from Misiones province, Argentina, and to propose a procedure validated by human experts. The model used the integration of several types of classifiers.The experimentation was performed with four data sets: a data set of dental implants made for the case study, an artificially generated data set, and two other data sets obtained from different data repositories. The results of the approach proposed were validated by the performance in classification made by human experts. Our approach achieved a success rate of 93% of correctly identified cases, whereas human experts achieved 87% accuracy. Based on this, we can argue that multi-classifier systems are a good approach to predict dental implant failures.Fil: Ganz, Nancy Beatriz. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Nordeste. Instituto de Materiales de Misiones. Universidad Nacional de Misiones. Facultad de Ciencias Exactas Químicas y Naturales. Instituto de Materiales de Misiones; ArgentinaFil: Ares, Alicia Esther. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Nordeste. Instituto de Materiales de Misiones. Universidad Nacional de Misiones. Facultad de Ciencias Exactas Químicas y Naturales. Instituto de Materiales de Misiones; ArgentinaFil: Kuna, Horacio Daniel. Universidad Nacional de Misiones. Facultad de Cs.exactas Quimicas y Naturales. Instituto de Investigacion Desarrollo E Innovacion En Informatica.; Argentin

    Procedimiento para mejorar la precisión en el acierto de los fracasos en implantes dentales mediante técnicas de ciencia de datos

    Get PDF
    Nowadays, the prediction about dental implant failure is determined through clinical and radiological evaluation. For this reason, predictions are highly dependent on the Implantologists’ experience. In addition, it is extremely crucial to detect in time if a dental implant is going to fail, due to time, cost, trauma to the patient, postoperative problems, among others. This paper proposes a procedure using multiple feature selection methods and classification algorithms to improve the accuracy of dental implant failures in the province of Misiones, Argentina, validated by human experts. The experimentation is performed with two data sets, a set of dental implants made for the case study and an artificially generated set. The proposed approach allows to know the most relevant features and improve the accuracy in the classification of the target class (dental implant failure), to avoid biasing the decision making based on the application and results of individual methods. The proposed approach achieves an accuracy of 79% of failures, while individual classifiers achieve a maximum of 72%.Hoy en día, la predicción del fracaso de un implante dental está determinado a través de una evaluación clínica y radiológica. Por esta razón, las predicciones dependen en gran medida de la experiencia del implantólogo. Además, es extremadamente crucial detectar a tiempo si un implante dental va a fallar, por cuestiones de tiempo, costo, traumas al paciente, problemas postoperatorios, entre otros. En este trabajo se propone un procedimiento mediante la utilización de múltiples métodos de selección de características y algoritmos de clasificación, para mejorar la precisión en el acierto de los fracasos en implantes dentales de la provincia de Misiones, Argentina validado por expertos humanos. La experimentación es realizada con cuatro conjuntos de datos, un conjunto de implantes dentales confeccionado para el estudio de caso, un conjunto generado artificialmente y otros dos conjuntos obtenidos de distintos repositorios de datos. El procedimiento propuesto permitió conocer las características más relevantes y mejoró la precisión en la clasificación de la clase objetivo (fracaso del implante dental), permitiendo no sesgar la toma de decisión en base a la aplicación y resultados de método individuales. El procedimiento propuesto consigue una precisión del 79% de los fracasos, mientras que los clasificadores individuales alcanzan un máximo del 72%.Fil: Ganz, Nancy Beatriz. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Nordeste. Instituto de Materiales de Misiones. Universidad Nacional de Misiones. Facultad de Ciencias Exactas Químicas y Naturales. Instituto de Materiales de Misiones; ArgentinaFil: Ares, Alicia Esther. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Nordeste. Instituto de Materiales de Misiones. Universidad Nacional de Misiones. Facultad de Ciencias Exactas Químicas y Naturales. Instituto de Materiales de Misiones; ArgentinaFil: Kuna, Horacio Daniel. Universidad Nacional de Misiones; Argentin

    Detección de datos anómalos y ruido en bases de datos abiertas para el contralor público, utilizando técnicas de minería de datos

    Get PDF
    Dentro de la abundante literatura que despliega la minería de datos aplicada al descubrimiento de información en bases de datos, las técnicas de detección de campos anómalos y con ruido han permanecido escasamente empleadas con propósitos dirigidos hacia el contralor cívico y la lucha contra la corrupción; sin embargo, estas pueden ser de suma utilidad en la evaluación de la calidad de bases de datos así como en el descubrimiento de indicios de comportamiento corrupto. En este trabajo, se desarrollan y articulan procedimientos híbridos de detección de datos anómalos y ruido para investigar, experimentar y validar su aplicación en sistemas de declaraciones juradas públicas disponibles actualmente en datos públicos abiertos.Sociedad Argentina de Informática e Investigación Operativa (SADIO

    Propuesta de detección de datos anómalos y ruido en declaraciones juradas públicas

    Get PDF
    Los procesos de detección de campos anómalos y con ruido son de suma utilidad para la evaluación de calidad de bases de datos de todo tipo. Estos procesos pueden tener una utilidad cívica y pública inédita si se encuentran dirigidos a la detección de valores anómalos en datos públicos. En este trabajo, se propone investigar la posibilidad de experimentación, validación y aplicación de procedimientos híbridos de detección de datos anómalos y ruido en sistemas de declaraciones juradas oficiales disponibles actualmente en Argentina.Outlier and noise detection processes are highly useful in the quality assessment of any kind of database. Such processes may have novel civic and public applications in the detection of anomalies in public data. The purpose of this work is to explore the possibilities of experimentation with, validation and application of hybrid outlier and noise detection procedures in public officials’ affidavit systems currently available in Argentina.XIII Workshop Base de Datos y Minería de DatosRed de Universidades con Carreras en Informática (RedUNCI

    Propuesta de detección de datos anómalos y ruido en declaraciones juradas públicas

    Get PDF
    Los procesos de detección de campos anómalos y con ruido son de suma utilidad para la evaluación de calidad de bases de datos de todo tipo. Estos procesos pueden tener una utilidad cívica y pública inédita si se encuentran dirigidos a la detección de valores anómalos en datos públicos. En este trabajo, se propone investigar la posibilidad de experimentación, validación y aplicación de procedimientos híbridos de detección de datos anómalos y ruido en sistemas de declaraciones juradas oficiales disponibles actualmente en Argentina.Outlier and noise detection processes are highly useful in the quality assessment of any kind of database. Such processes may have novel civic and public applications in the detection of anomalies in public data. The purpose of this work is to explore the possibilities of experimentation with, validation and application of hybrid outlier and noise detection procedures in public officials’ affidavit systems currently available in Argentina.XIII Workshop Base de Datos y Minería de DatosRed de Universidades con Carreras en Informática (RedUNCI

    Propuesta de detección de datos anómalos y ruido en declaraciones juradas públicas

    Get PDF
    Los procesos de detección de campos anómalos y con ruido son de suma utilidad para la evaluación de calidad de bases de datos de todo tipo. Estos procesos pueden tener una utilidad cívica y pública inédita si se encuentran dirigidos a la detección de valores anómalos en datos públicos. En este trabajo, se propone investigar la posibilidad de experimentación, validación y aplicación de procedimientos híbridos de detección de datos anómalos y ruido en sistemas de declaraciones juradas oficiales disponibles actualmente en Argentina.Outlier and noise detection processes are highly useful in the quality assessment of any kind of database. Such processes may have novel civic and public applications in the detection of anomalies in public data. The purpose of this work is to explore the possibilities of experimentation with, validation and application of hybrid outlier and noise detection procedures in public officials’ affidavit systems currently available in Argentina.XIII Workshop Base de Datos y Minería de DatosRed de Universidades con Carreras en Informática (RedUNCI
    corecore